#H200 晶片
監管批准字節跳動、阿里巴巴、騰訊等公司哦買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻
監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片/Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻/比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始/小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%監管剛批了40萬塊H200,黃仁勳轉頭宣佈:我已經開始重新生產了!今年1月,監管批准字節跳動、阿里巴巴、騰訊等中國科技巨頭購買超過40萬塊輝達H200晶片,總價值約100億美元。這是中美晶片博弈裡罕見的"開綠燈"時刻——美國出口管制繞了一大圈,監管蓋了章,DeepSeek也在其中拿到了有條件購買許可。(來源:Reuters、《華爾街日報》)與此同時,中國官方發言人回應說"不瞭解具體情況"——100億美元的訂單,官方說不知道,這已經是一種態度了。更快的是輝達這邊。2026年3月17日,CEO黃仁勳在GTC大會上直接宣佈:已收到來自"眾多客戶"的訂單,H200中國版正在重啟生產。幾周前訂單來了,幾周內工廠開動。禁令、解禁、重啟,這條鏈條走完只用了不到兩個月。100億美元擺在那裡,到底是管制有效,還是管制本身就是一筆生意?(來源:Axios、CNBC)不是降級版!輝達Groq晶片5月入華,這次連"特供"都省了輝達去年底以約200億美元收購了推理晶片公司Groq,現在這顆晶片要直接賣給中國了。據Reuters消息,輝達正在為中國市場準備一款Groq晶片,預計5月上市,面向AI推理業務——也就是模型跑起來之後回答問題、執行任務那個環節。更關鍵的是,知情人士明確透露:這款晶片不是降級版,也不是專為中國特供的閹割版本。(來源:Reuters)之前H20是專門為中國"定製"的縮水版,這次連縮水都免了。這個時間點很微妙。H200剛剛重啟生產,Groq非降級版緊跟著入場,輝達在中國市場一口氣佈局兩條產品線。可美國出口管制的框架還掛在那裡,Groq晶片究竟走的是那個口子,目前沒有官方解釋。監管還沒表態,晶片已經在路上——黃仁勳每次在華盛頓和監管之間走鋼絲,都比上次走得更穩一點。(來源:Reuters)五角大樓要讓AI公司進軍事機密庫訓練模型,這件事比你想像的更炸這件事3月17日才被MIT Technology Review報導出來,五角大樓正在討論一個計畫:為AI公司建立安全隔離環境,讓它們用機密軍事資料訓練專屬的軍用版模型。不是部署,是訓練。意味著OpenAI、Anthropic或者Google的工程師,理論上可以接觸到美軍的機密資料集來"喂"模型。這是一個史無前例的方向,之前從來沒有商業AI公司被允許碰這類東西。(來源:MIT Technology Review)背景是:OpenAI已經與五角大樓簽了在機密網路中部署AI系統的協議,國防部也在今年1月發佈了AI戰略備忘錄。問題是,訓練和部署是兩件性質完全不同的事。部署是讓AI用軍事資訊,訓練是讓軍事資訊變成AI的一部分——這兩者之間的資料安全邊界,目前沒有任何明確的技術標準或法律框架來界定。Hegseth已經警告Anthropic必須配合軍方,OpenAI也大方接單。但誰來決定這些模型最終學到了什麼、記住了什麼,答案目前是:沒人知道。(來源:MIT Technology Review、PBS)GPT-5.4 mini和nano來了——OpenAI說這是"最強小模型",速度快了2倍多OpenAI正式發佈GPT-5.4 mini和GPT-5.4 nano,主打Agent、程式碼生成、多模態工作流,定位是"以極低成本提供接近GPT-5.4水準的性能"。GPT-5.4 mini相比上一代GPT-5 mini,在程式設計、推理、多模態理解、工具呼叫上全面提升,速度快了2倍以上;兩款模型都支援40萬token的超長上下文窗口(大約30萬個漢字),專門針對需要大量子任務串聯的Agent場景做了最佳化。(來源:OpenAI、ZDNET)這對開發者來說是實打實的降本消息——頂級性能的七成,花頂級價格的一個零頭。但OpenAI這一步的棋感,很微妙。GPT-5.4 mini是給API用量大、成本敏感的企業用的,nano是面向更高頻的輕量場景。兩款小模型同時推,等於在Agent賽道上把價格門檻砸穿——競爭對手做的那套"小模型夠用論",OpenAI直接親自驗證了。Anthropic、Google同樣有自己的"小強模型",但現在面對的問題是:你的小模型,是不是真的比OpenAI的小模型更小、更便宜、還更好用?(來源:OpenAI、ZDNET)阿里、騰訊都搶了,百度終於把"小龍蝦"塞進了小度音箱中國AI圈這陣子有個新詞叫"養龍蝦"——OpenClaw是一個開源AI Agent框架,因為logo像龍蝦,被叫爆了。騰訊最先動,做了QClaw接入微信和QQ;阿里隨後跟上。3月17日,百度宣佈將OpenClaw整合進旗下小度(Xiaodu)智能音箱,讓小度變成一個語音控制的Agent遙控器,用一句話就能觸發跨應用的複雜任務。(來源:Bloomberg)三大廠同台,百度靠的是硬體入口:小度的螢幕和麥克風,是其他兩家沒有的物理觸點。但有趣的是,在這場搶跑裡,百度的AI雲收入剛剛同比增長38%,OpenClaw的整合宣佈同一天發佈,時機選得極準——用一個熱詞捆綁一個財報數字,這是一種很熟練的敘事操作。問題是,把Agent塞進音箱和塞進聊天框,那個更容易讓使用者真的用起來?目前沒有任何資料,三家都在同一起跑線上等答案。(來源:Bloomberg)阿里巴巴發佈"悟空"平台,讓AI幫企業打工——現在還在內測阿里巴巴正式推出企業級AI平台"悟空(Wukong)",目前處於封閉測試階段。悟空的核心邏輯是協調多個AI Agent配合工作,處理文件編輯、表格操作、商業研究等複雜企業任務——不是一個聊天機器人,而是一套能"自己分工幹活"的Agent調度系統。(來源:Reuters)時間節點同樣刻意:剛好在中國agent熱潮爆發的那個當口,騰訊在聊,百度在跟,阿里這次選擇先做企業端。悟空和同期宣佈的"Token Hub"是阿里AI戰略的兩面。Token Hub是整合阿里所有AI研究、消費者產品、AI應用的新業務集團,由CEO吳泳銘(Eddie Wu)親自掛帥,核心命題是AI變現。(來源:Bloomberg)悟空是變現的產品抓手,Token Hub是整合內部資源的組織容器——從架構上看,這是阿里把AI從"成本中心"推向"利潤中心"的一次整體操刀。但封閉內測的悟空究竟什麼時候能開放,阿里沒說。(來源:Reuters)Manus突然下載到我電腦裡了!"My Computer"讓AI Agent徹底告別雲端2026年3月16日,Manus正式發佈桌面應用,核心功能叫"My Computer"——可在Windows和macOS上運行,讓AI Agent直接訪問你的本地檔案、瀏覽器、應用程式,以及在你電腦空閒時自動幹活。這是Manus從雲端走向本地的關鍵一步。之前Manus能做的事,都發生在遠端沙盒裡;現在它可以直接讀你的項目資料夾、開你本地的IDE、在你不看螢幕的時候繼續工作。(來源:Manus官網、9to5Mac)這不是"助手",更像一個在你電腦裡常駐的無聲員工。這件事最讓人不安的地方,恰恰是它最吸引人的地方——AI終於能碰你真實的本地資料了。雲端Agent和本地Agent的最大區別,就是這道"能不能接觸到你實際工作環境"的門檻。Manus選擇在這個時間點把門踢開,意味著Agent賽道的戰場從"在雲上幫你查資料",正式移到了"在你的電腦裡幫你幹活"。Cursor在程式碼領域已經打通了這一層,現在Manus要在更寬泛的通用任務上複製這條路——誰先讓使用者真的放心把電腦交出去,誰就贏了。(來源:Manus官網)比亞迪、吉利簽了Nvidia,Uber要在28個城市開無人計程車——2027年就開始輝達在GTC 2026大會上宣佈:比亞迪、吉利、五十鈴、日產四大車企將採用其DRIVE Hyperion自動駕駛平台,支援Level 4等級無人駕駛車輛。同時,Uber與輝達擴大合作,計畫2027年上半年率先在洛杉磯和舊金山推出全端Robotaxi服務,並於2028年擴展至覆蓋四大洲的28個城市。(來源:Nvidia官方、The Verge)一次發佈會,輝達同時繫結了整車製造端和出行營運端——中美日的車企,全進了這張網。這個陣容有點意思。比亞迪和吉利是中國新能源頭部,五十鈴是日本商用車代表,日產是傳統燃油巨頭——四種不同背景的車企,同時選了輝達的同一套平台,這本身就是一種背書。Waymo已經在舊金山和鳳凰城跑了好幾年,Cruise折戟,特斯拉Full Self-Driving還在講故事;輝達這次的策略不是自己造車,而是把自己做成Robotaxi時代的"底盤供應商"。2027年不到兩年,洛杉磯的街上會不會真的有Uber+輝達的無人車跑起來,值得盯著看。(來源:Reuters、The Verge)騰訊QClaw內測,14億微信使用者的手機裡快要住進一隻"AI龍蝦"了騰訊正在內測一款名為QClaw的產品——這是OpenClaw的微信/QQ雙端一鍵啟動包,讓使用者直接在微信聊天框裡調起AI Agent,完成本來需要跨多個App切換才能做完的任務。(來源:新浪科技、知乎)微信12億活躍使用者,QQ幾億年輕使用者,QClaw一旦全面上線,等於給OpenClaw這套開源框架接上了一個全球最大的流量入口。騰訊之前在AI產品上一直給人"慢半拍"的感覺,這次的動作算是把入口優勢打出來了。但QClaw目前只是內測,預計"近期上線"——沒有正式發佈日期。在這條賽道上,阿里的悟空也在等開放,百度小度已經宣佈整合,OpenClaw在中國的生態正在被三大廠同時圈地。微信入口的流量是真實的,但Agent能不能在14億人的聊天框裡真正活下來,取決於它能不能在一個"對話"介面裡把任務做得比人工快。這一步,騰訊比阿里和百度都更有條件驗證——問題只是它動不動得快。(來源:36氪、財富號)小米MiMo負責人帶著北大團隊炸場:強化學習訓練成本直降71.2%2026年3月16日,小米MiMo大模型負責人羅福莉與監管大學研究團隊聯合發佈ARL-Tangram系統,這是一套針對Agent強化學習的統一資源管理框架,核心數字是:將強化學習訓練步驟持續時長縮短至多1.5倍,節省高達71.2%的外部算力資源,同時在真實世界Agent任務上平均ACT提升4.3分。(來源:IT之家、新浪財經)簡單說,同樣的訓練效果,花的錢不到原來的三成。這在當下算力極度緊缺、訓練成本居高不下的背景下,是非常實際的突破。但這篇論文更值得注意的,是它的位置。羅福莉是小米內部MiMo模型的負責人,ARL-Tangram發的不是產品,是學術論文——小米在用學術成果的方式宣示自己在大模型基礎研究上有真正的積累。三月的AI圈到處是"發佈會",小米選擇發一篇論文。在大廠裡,這種動作通常意味著:接下來會有更大的東西落地。算力成本降了70%,下一步的問題是,這個效率用在那裡?(來源:搜狐、IT之家)Kimi動了11年沒人敢碰的Transformer結構,馬斯克說:令人印象深刻2026年3月16日,月之暗面三位聯合創始人楊植麟、吳育昕、周昕宇與數十名研究員聯署,發佈了一篇純架構層面的技術報告。他們重新設計了大模型的核心結構——殘差連接(Residual Connection),這個元件自2015年引入Transformer以來,超過10年幾乎沒有人動過。Kimi的方案讓每一層能夠選擇性地關注此前各層的輸出,而不是統一求和,實驗結果是48B參數規模的模型訓練效率提升1.25倍。(來源:新浪財經、澎湃新聞)論文發出後,馬斯克本人評價"令人印象深刻",前OpenAI研究科學家Andrej Karpathy同樣給予好評。這篇報告的戲劇性,不在於那1.25倍的效率提升,而在於它選擇攻擊的目標——一個10年沒人敢改的基礎元件。大多數模型創新發生在訓練方法、資料配比、規模擴展上;動架構本身,是風險最高也最難被外界驗證的路。三位聯合創始人都署名,不像是一篇普通論文,更像是一份聲明:Kimi在做自己的事,而不是跟在別人後面堆參數。馬斯克和Karpathy的背書,給了這篇論文在國際AI圈的能見度——但它能不能真正改變下一代模型的架構選擇,還需要時間驗證。 (AI Daily Insights)
H200晶片:川普對字節開出三重條件!
路透社今日凌晨援引白宮及字節跳動內部人士稱,川普政府已給字節跳動開出“一人一策”准入清單:若希望繼續執行 3.2 萬顆 H200 訂單,須先繳納 30% 關稅(約 2.8 億美元)、接受美方技術審計並簽署“非軍用、非超算”終端使用者承諾書,三份檔案全部落地後,美國商務部才予以個案出口許可。消息透露,川普 2 月 3 日深夜在白宮橢圓形辦公室聽取對華 AI 晶片匯報後,親自拍板“ByteDance must pay first”,要求關稅以現金形式匯入美國財政部指定帳戶,且不得通過第三國轉口避稅。技術審計則將由商務部工業與安全域(BIS)派遣駐場團隊,對字節跳動中國機房進行遠端與現場核查,確保 H200 僅用於“消費者推薦演算法”,不得接入任何軍工網路或超算叢集。字節跳動已預付 7 億美元貨款,但新條件意味著總成本將再增約 2.8 億美元,且需承擔美方審計費用。公司內部人士對記者表示,管理層正在評估“接受條件”與“全額退款”兩套方案,“若關稅和審計成本超過 3 億美元,ROI 將低於國產 GPU 替代方案”。分析認為,川普政府對字節跳動開出“關稅 + 審計 + 承諾”三重條件,標誌著對華 AI 晶片出口從“紅線管制”轉向“一人一策”精準封堵。若字節跳動接受條件,將成為首家被美方現場審計的中國雲廠商;若選擇退款,國產 GPU 將再獲 3 億美元級替代訂單,2026 年訓練卡市佔率有望突破 40%。無論結果如何,川普的“條件書”已讓矽谷明白:對中國客戶的每一顆 AI 晶片,都可能附帶一張華盛頓的“政治發票”。 (晶片行業)
美國安全審查突襲,中國H200訂單全線凍結!
英國《金融時報》今日援引三位白宮及國會消息人士稱,美國國家安全委員會(NSC)於2月3日啟動新一輪對華AI晶片安全審查,已要求輝達暫停所有H200對華銷售申請,待審查結束後方可重啟批文流程。這意味著原本已獲“口頭放行”的50萬顆H200再次停擺,中國雲廠商春節前搶貨計畫被迫中斷。審查焦點在於“中國潛在用途”與CUDA生態技術外溢風險。NSC擔心,H200雖低於70 TFLOPS紅線,但可通過堆疊組成超算叢集,用於高超音速模擬與情報分析。國會助手透露,此次審查可能持續45-60天,且不排除將H200納入《國際武器貿易條例》(ITAR)管制清單。輝達凌晨回應,將“全面配合政府審查”,並暫停向中國客戶傳送任何新銷售要約。公司已通知阿里、字節等大客戶:已預付但未清關的訂單將暫緩發貨,可選擇退款(扣除物流與關稅成本)或轉口至第三國。現貨市場應聲跳漲:香港倉庫提貨價從4.2萬美元回彈至5萬美元,中間商開始囤貨待漲。中國國產GPU廠商連夜促銷:寒武紀MLU 300現貨價下調至0.95萬美元,並提供120天帳期;摩爾線程把S5000租金再降20%,諮詢量兩日增長3倍。業內普遍認為,若審查持續至4月,中國雲廠商將被迫擴大中國國產卡採購,2026年中國國產AI晶片市佔率有望從18%躍升至35%。對於仍在擴建的中國國產GPU、HBM與封裝產業鏈而言,美國再次“關門”意味著9個月替代窗口正式開啟。 (晶片行業)
日經新聞—中美H200半導體博弈:美國加稅賣,中國或限買
川普15日針對輝達在台灣製造的H200等半導體加征25%關稅,但有條件地允許對華出口。出口對象被認為的是在中國大陸開展業務的西方國家企業。據稱目前中國大陸尚未允許進口H200……美國川普政府1月15日針對輝達在台灣製造的“H200”等部分尖端半導體加征25%關稅。對於向中國大陸再出口等徵稅,但有條件地允許對華出口。這被認為是對重視中國市場的美國半導體企業的照顧,但希望提高自給率的中國正在摸索對進口加強限制。中美在生成式AI和物理AI領域進行開發競爭中美爭奪高科技主導權,除了生成式AI之外,還圍繞物理AI的技術開發展開競爭。對於成為核心的AI半導體,中美正在持續博弈。川普1月14日簽署了關於加征關稅的行政命令。這是基於《貿易擴展法》第232條的行業關稅。美國國內使用的進口商品不徵收關稅。設想適用關稅的是輝達為了向中國大陸出口在台灣製造的H200而暫時將其運到美國等情況。川普2025年12月表示,作為允許H200等對華出口的交換,將徵收25%的“上繳金”。此次的加征關稅實際上相當於上繳金。在加征關稅之前,美國商務部1月13日提出了將AI半導體對華出口放寬為許可制的新規。H200和美國AMD的“MI325X”向中國供貨時,必須在美國國內接受第三方機構的檢測,因此可能會被徵收額外關稅。美國要求輝達等對中國的出口量不得超過對美國出貨量的50%。為了優先美國國內的需求,還要求把美國國內剩餘的部分用於對華出口。在此基礎上,美國商務部工業和安全域(BIS)將逐案審查可否出口。出口對象被認為的是在中國開展業務的西方國家的企業。原則上仍禁止向總部設在中國的中國企業出口。輝達的公關負責人14日對《日本經濟新聞》表示,“對川普的決定表示讚賞”,對允許H200出口表示歡迎。重視中國業務的輝達曾遊說美國政府,希望允許其向中國出口AI半導體。該公司似乎認為即使支付額外關稅也有好處。不過,在中國推進AI開發的主要是受美國政府限制的中國企業。輝達的公關負責人表示,出口許可制“實現了對美國有益的深思熟慮的平衡”,但H200出口許可對業績帶來的影響可能有限。川普政府希望通過允許出口來確保美國半導體企業的營收,同時保留對華管制,避免中國的AI研發能力超過美國。新框架能否按照其設想發揮作用尚不得而知。日本經濟新聞的英文媒體Nikkei Asia在1月15日報導稱,熟悉中國方面情況的相關人士透露,針對中國企業可購買的輝達等的尖端半導體,中國政府正在討論限制總量。美國調查公司伯恩斯坦稱,H200的計算處理性能超過中國企業的競爭產品。中國獲得的好處是,如能夠進口H200,AI開發將變得容易。但是中國仍試圖限制進口,原因是中國政府一直致力於增強本國企業的尖端半導體供應能力。中國科技巨頭尋求購買美國企業的尖端半導體,如果全面允許進口H200,有可能對提高自給率造成打擊。據稱目前中國尚未允許進口H200。 (日經中文網)
彭博:中國最快本季內批准進口輝達H200晶片
彭博引述知情人士稱,中國計畫最快在本季度內允許部分使用者進口輝達的H200晶片。此舉將使這家全球市值最高的晶片公司重新進入中國這一重要市場。知情人士表示,中國官方正在準備有選擇地允許境內公司在商業領域使用該晶片。監於安全考慮,中國將不允許在軍用、敏感政府部門、關鍵基礎設施領域等領域使用該晶片。知情人士還稱,如果上述機構確有使用需求,則需要逐個申請,以一事一議的方式決定是否放行。即使附帶這些條件,中國部分放行H200晶片對輝達也意味著一個重大勝利。中國是全球最大的晶片市場之一。輝達行政總裁黃仁勳此前表示,中國的AI晶片市場規模有望達到500億美元。一位知情人士稱,阿里巴巴和字節跳動已同輝達私下接觸,分別表達各自購買超過20萬顆H200晶片的意向。這兩家企業,還有包括DeepSeek在內的一些中國初創企業,正快速迭代他們的人工智慧模型以同諸如OpenAI之類的美國對手競爭。輝達公司管理層本周表示,中國客戶對H200的需求很強勁,但是公司尚未與中國官方就允許進口進行直接對話,也不知道中國何時會放行進口。而對華出售晶片的許可申請已經提交給美國政府,美國政府正在確定許可的最終細節。 (格隆匯電報)
民主黨聯名警告川普:凍結H200出口!
美國線上新聞網站AOL今日披露,35名民主黨參議員與92名眾議員聯名致信候任總統川普,要求“立即凍結”輝達向中國出口H200 GPU的年度許可,並重新審查已於去年12月底發放的50萬顆配額。議員們在信中警告,一旦50萬顆算力卡流入中國,相當於“把40 EFLOPS的AI潛能交到潛在對手手中”,將削弱美國在軍事模擬、情報分析、高超音速武器設計等關鍵領域的領先地位。聯名信指出,H200的單卡INT8算力1536 TOPS雖低於現行管制紅線,但可通過多卡並聯快速堆疊超算,“理論上6000台8卡伺服器即可達到美國能源部Frontier超算的AI水平”。信中還援引五角大樓內部簡報稱,中國已計畫將採購的H200用於下一代“智能指揮與火力控制”大模型訓練,“每多出口1 TOPS,都是在資助對手的決策優勢”。川普過渡團隊尚未正式回應,但熟悉內情的共和黨顧問透露,總統本人“傾向於維持強硬立場”,可能在上任後10日內要求BIS(商務部工業與安全域)重新評估H200的許可證。若評估結果不利,已發放的年度批次許可(AVL)將被暫停或追加限制條款,例如要求客戶證明“不涉及軍事最終用途”。輝達方面則緊急展開遊說。公司政府事務部已提交一份長達47頁的“經濟影響報告”,聲稱若取消訂單,將直接導致:台積電南京CoWoS產線閒置,損失12億美元營收;美國本土Austin軟體中心被迫裁員1200人;中國客戶全面轉向國產或第三國方案,削弱CUDA生態鎖定。報告還警告,歐洲、中東客戶可能因“政策不確定性”同步砍單,輝達2026財年營收預期將下調8%。中國雲廠商則開始“搶閘”提貨。字節跳動昨日凌晨把原定於2月底的1.2萬顆H200提貨期提前至1月15日,並派出物流團隊駐廠南京封裝基地;阿里巴巴亦追加預付款5億美元,要求春節前至少交付2萬顆。某頭部ODM駐南京代表告訴記者,當前每天出貨約1200顆,若華盛頓突然喊停,“估計48小時內就會封倉”。國產GPU陣營則樂見風聲收緊。摩爾線程內部檔案顯示,公司已把MTT S5000定價下調15%,並承諾“相容CUDA 12.4”,目標在Q1搶佔1萬顆H200替代訂單;華為亦緊急釋放3萬片昇騰910B庫存,價格低至1.2萬美元,相當於H200的43%。國會助理透露,民主黨議員正醞釀在2026財年國防授權法案(NDAA)中加入“70 TFLOPS以下AI晶片對華出口須國會事前批准”條款,一旦通過,所有低於現行管制門檻的“灰色地帶”產品都將被拉上投票桌,輝達未來對華出貨將陷入“年年審批、月月不確定性”的循環。對於正處於“窗口期”的中國AI產業而言,H200能否順利到岸,將直接影響2026年大模型訓練節奏。業內普遍預計,若華盛頓最終收回許可,國產GPU將迎來兩年替代空窗,但若放行,則輝達將繼續佔據中國AI加速市場六成以上份額,把國產生態的追趕期再次拉長。 (晶片行業)